V2EX  ›  英汉词典

Deep Q-Network

定义 Definition

Deep Q-Network(DQN):一种将深度神经网络Q-learning结合的强化学习方法,用神经网络近似动作价值函数 (Q(s,a)),常用于在高维状态输入(如像素图像)下学习决策策略。常见关键技巧包括经验回放(experience replay)目标网络(target network)以提升训练稳定性。

发音 Pronunciation (IPA)

/ˌdiːp ˈkjuː ˌnɛtˈwɝːk/

例句 Examples

The agent learned to play the game using a deep Q-network.
智能体使用深度Q网络学会了玩这款游戏。

By combining experience replay with a deep Q-network, the researchers stabilized training and achieved strong performance on Atari benchmarks.
通过将经验回放与深度Q网络结合,研究人员稳定了训练,并在Atari基准测试上取得了很强的表现。

词源 Etymology

Deep Q-Network由三部分构成:deep(深度的)指深度学习中的多层神经网络;Q来自强化学习里的Q-function / Q-value(动作价值)概念(源于Q-learning命名传统);network(网络)指用神经网络来近似 (Q(s,a))。该术语因2010年代中期DeepMind在Atari游戏上的突破性成果而广泛流行。

相关词 Related Words

文学与著名作品 Literary / Notable Works

  • Mnih et al. (2015), Human-level control through deep reinforcement learning(Nature):最著名的DQN论文之一,将DQN推广为“深度强化学习”标志性方法。
  • Mnih et al. (2013), Playing Atari with Deep Reinforcement Learning(arXiv/DeepMind技术报告):DQN早期版本与核心思想的经典出处。
  • Sutton & Barto, Reinforcement Learning: An Introduction(强化学习经典教材):虽不以DQN为主线,但系统介绍Q-learning等基础概念,是理解DQN的关键背景读物。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2000 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 12:22 · PVG 20:22 · LAX 04:22 · JFK 07:22
♥ Do have faith in what you're doing.